国土交通省による基幹統計「建設工事受注動態統計」の不正。本省職員らがデータを無断で書き換えて二重計上したことで、統計はどれだけ過大になっていたのか。朝日新聞が2020年度分に絞って過大額を試算したところ、約4兆円に上っていた疑いがあることがわかった。試算は公表済みのデータを基に専門家らの助言を得ながら慎重に進めた。
単純な引き算だが……
過大になっている不正な統計から、正しい統計を引けば、差額がわかる。その差額が「過大額」だ。単純な引き算ができればいい。
不正な統計をAと表記して考えていく。公表済みだが、書き換えにより過大になっているものだ。
正しい統計をBと表記して考える。これは公表されていないものだ。
AとBを使って式に表すと簡単に見える。
20年度の統計は2パターンあった
A-B=過大額
この計算をすることが目標となる。
20年度の1年間だけに絞って考えることにした。
20年度は、国交省の本省職員が書き換え行為を行っていた時期だ。具体的には、本来、合算すべきでない受注実績を、計2カ月分、合算して集計していた。
前提が違う
まず調べたのは、そもそも何が公表されているのか、だ。
Aは公表されている。Bは非公表。そのほかに、Aとは別のパターンの20年度の統計が公表されていた。これをCと表記して考えることにした。
Cとは何か。具体的には、21年度から新たに導入された計算ルールをさかのぼって20年度の統計に適用したものだ。書き換え前の正しいデータを基につくられているから、二重計上による上ぶれは原則として生じていない。
AとCの違いを整理するとこうなる。
A 旧計算ルール(~20年度)で計算した20年度の統計。不正な書き換えによる過去分データの合算あり。
C 新計算ルール(21年度~)をさかのぼって使い計算した20年度の統計。不正な書き換えによる過去分データの合算なし。
計算ルールが新旧で異なるため、AとCを単純に比べることはできない。Aは過去分のデータが不正に合算された過大な統計で、Cは過去分の合算がなく過大になっていない統計だが、単純に「A-C」という計算をしても「過大額」を知ることはできないわけだ。
迷路に迷い込んだ
そこで、前提条件をそろえる方法を探ることにした。
まず欠かせないのが、新旧の計算ルールの違いを理解することだ。国交省はホームページにその説明文を掲載していた。
カギは「4月」だった
新計算ルールでは、旧計算ルールに新たに「係数」(母集団の欠測値を埋めて補正するためのもの)をかける、という概要だ。単純にイメージを記すと次のようになる。
旧計算ルールの統計×係数=…
Source : 社会 – 朝日新聞デジタル